EJEMPLO CON MÁS DE DOS GRUPOS
Para este ejemplo, tomaremos los datos de las frecuencias sanguíneas de ABO, disponibles en la página de Wikipedia
Posteriormente, se limpió y se agregó los continentes de cada país.
Blood_type_new <- read_excel("data/Blood_type_final.xlsx")
head(Blood_type_new)
# A tibble: 6 x 11
continent country population `O+` `A+` `B+` `AB+` `O-` `A-` `B-`
<chr> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 Europa Albania 3074579 0.341 0.312 0.145 0.052 0.06 0.055 0.026
2 Africa Algeria 43576691 0.4 0.3 0.15 0.0425 0.066 0.023 0.011
3 America Argentina 45479118 0.489 0.315 0.08 0.0245 0.049 0.0316 0.008
4 Asia Armenia 3021324 0.29 0.463 0.12 0.056 0.02 0.037 0.01
5 Oceania Australia 25466459 0.38 0.32 0.12 0.04 0.07 0.06 0.02
6 Europa Austria 8859449 0.3 0.37 0.12 0.05 0.06 0.07 0.02
# i 1 more variable: `AB-` <dbl>
Nos aseguramos que la variable continente sea leida como categórica
Blood_type_new$continent <- factor(Blood_type_new$continent)
Y eliminamos a Oceanía por tener poca frecuencia
Blood_type_new <- Blood_type_new[Blood_type_new$continent != "Oceania", ]